Análisis de Series Temporales

IOT Analytics

Preparación para analizar los datos. Series temporales

Objetivo

Proyección del consumo energético a través de series temporales.

Procedimiento

Estudiaremos los datos de consumo energético correspondientes a los años 2007 a 2009 a través de series temporales.

Haremos proyección de futuro para el año 2010 y compararemos los resultados con los datos reales de este último año (serie real).

Preparación para analizar los datos. Primera visualización

Evolución mensual del consumo. Años 2007-2009

Vamos a representar la serie por meses para cada submedidor y tambien para la energía global co granularidad mensual. En este caso, la frecuencia será 12, tenemos una observación por mes para los años 2007,8 y 2009.

Parece que los datos tienen estacionariedad (movimientos que se repiten cada año), esto ocurre para todas las variables.

Forecasting antes de descomponer la serie

Vamos a plicar regresión lineal a cada serie temporal, y veremos el valor de \(R^2\) y del error cuadrático medio.

Evolución mensual del consumo. Años 2007-2009

SM1. Cocina

Modelo

Call:
tslm(formula = tsSM1_Mensual ~ trend + season)

Residuals:
     Min       1Q   Median       3Q      Max 
-20522.7  -5190.9    215.7   6726.8  16702.8 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)  66531.9     7294.5   9.121 4.21e-09 ***
trend         -173.1      200.7  -0.862 0.397393    
season2     -19137.6     9635.6  -1.986 0.059061 .  
season3      -1263.5     9641.8  -0.131 0.896879    
season4     -15856.4     9652.3  -1.643 0.114034    
season5      -6134.4     9666.9  -0.635 0.531966    
season6      -9988.0     9685.6  -1.031 0.313160    
season7     -27046.6     9708.4  -2.786 0.010505 *  
season8     -38674.8     9735.4  -3.973 0.000602 ***
season9     -10641.7     9766.3  -1.090 0.287159    
season10    -15040.7     9801.3  -1.535 0.138536    
season11     -6105.3     9840.3  -0.620 0.541071    
season12     -3378.2     9883.2  -0.342 0.735595    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 11800 on 23 degrees of freedom
Multiple R-squared:  0.5796,    Adjusted R-squared:  0.3603 
F-statistic: 2.643 on 12 and 23 DF,  p-value: 0.02184

Resultados:

  • Valor del coeficiente de determinación: 0.5796. Es un valor bajo, el modelo únicamente explica el 58% de la variabilidad total.

  • Hay tres coeficientes significativamente no nulos.

Predicción IC

Predicción para los próximos 20 días

SM2. Lavadero

Modelo

Call:
tslm(formula = tsSM2_Mensual ~ trend + season)

Residuals:
   Min     1Q Median     3Q    Max 
-26325  -4033   1223   6470  16873 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)  83389.3     7617.6  10.947 1.35e-10 ***
trend         -898.9      209.6  -4.289 0.000274 ***
season2     -13475.5    10062.5  -1.339 0.193598    
season3       7508.4    10069.0   0.746 0.463406    
season4     -15023.1    10079.9  -1.490 0.149708    
season5      -7727.5    10095.2  -0.765 0.451777    
season6     -11683.0    10114.7  -1.155 0.259931    
season7     -19075.8    10138.6  -1.882 0.072621 .  
season8     -28408.6    10166.7  -2.794 0.010305 *  
season9      -9204.4    10199.1  -0.902 0.376160    
season10      4809.1    10235.6   0.470 0.642890    
season11     -1696.0    10276.3  -0.165 0.870356    
season12     -3191.5    10321.1  -0.309 0.759941    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 12320 on 23 degrees of freedom
Multiple R-squared:  0.6541,    Adjusted R-squared:  0.4736 
F-statistic: 3.624 on 12 and 23 DF,  p-value: 0.003891

Resultados:

  • Valor del coeficiente de determinación: 0.6541. Es un valor bajo, el modelo únicamente explica el 65% de la variabilidad total.

  • Hay tres coeficientes significativamente no nulos.

Predicción IC

Predicción para los próximos 12 meses (año 2010)

Se prevee una bajada del consumo

SM3. AC y termo

Modelo

Call:
tslm(formula = tsSM3_Mensual ~ trend + season)

Residuals:
   Min     1Q Median     3Q    Max 
-87112 -18443   4781  17647  82107 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)   299382      23189  12.911 5.06e-12 ***
trend           1866        638   2.926  0.00761 ** 
season2       -50805      30631  -1.659  0.11077    
season3       -29034      30651  -0.947  0.35336    
season4       -64190      30684  -2.092  0.04768 *  
season5       -54165      30730  -1.763  0.09125 .  
season6       -85197      30790  -2.767  0.01097 *  
season7      -144850      30863  -4.693 1.00e-04 ***
season8      -171144      30948  -5.530 1.27e-05 ***
season9       -69624      31047  -2.243  0.03486 *  
season10      -52696      31158  -1.691  0.10430    
season11      -37281      31282  -1.192  0.24550    
season12        7092      31418   0.226  0.82341    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 37510 on 23 degrees of freedom
Multiple R-squared:  0.7577,    Adjusted R-squared:  0.6312 
F-statistic: 5.992 on 12 and 23 DF,  p-value: 0.0001238

Resultados:

  • Valor del coeficiente de determinación: 0.7577. Es un valor que podría ser aceptable, el modelo únicamente explica el 76% de la variabilidad total.

  • Hay tres coeficientes significativamente no nulos.

Predicción IC

Predicción para los próximos 12 meses (año 2010)

Se prevee una bajada del consumo

Comparación de los coeficientes y resultados de cada modelo

Submedidor RMSE R2
Cocina 11186.74 0.5796
Lavadero 10939.60 0.6541
AC y TermoE 57300.05 0.7577

El RMSE del modelo con mejor coeficiente de determinación es el más alto. Pero no hay que olvidar que el consumo eléctrico para el submedidor correspondiente al AC y termo eléctrico es el que más energía consume de todos con una diferencia muy grande.

Forecasting descomponiendo la serie (así ok)

Descomponer: quitar tendencia

Descomposición y visualización

Evolución mensual del consumo. Años 2007-2009

Submetering 1

         Length Class  Mode     
x        36     ts     numeric  
seasonal 36     ts     numeric  
trend    36     ts     numeric  
random   36     ts     numeric  
figure   12     -none- numeric  
type      1     -none- character

Se aprecia componente estacional: oscilacione que se repiten cada año. La componente tendencia tambien se aprecia. Tendencia decreciente.

Submetering 2

         Length Class  Mode     
x        36     ts     numeric  
seasonal 36     ts     numeric  
trend    36     ts     numeric  
random   36     ts     numeric  
figure   12     -none- numeric  
type      1     -none- character

Se aprecia componente estacional: oscilacione que se repiten cada año. La componente tendencia tambien se aprecia. Tendencia decreciente.

Submetering 3

         Length Class  Mode     
x        36     ts     numeric  
seasonal 36     ts     numeric  
trend    36     ts     numeric  
random   36     ts     numeric  
figure   12     -none- numeric  
type      1     -none- character

Se aprecia componente estacional: oscilacione que se repiten cada año. La componente tendencia tambien se aprecia. Tendencia creciente

Predicción con Holt-Winters (suavizado exponencial)

Sin estacionalidad

Sería interesante verlo también con estacionalidad, para ver si se mantiene o no la tendencia.

Tendencia de predicción (crecimiento o decrecimiento del consumo) y predicción teniendo en cuenta las componentes

Evolución mensual del consumo (sin estacionalidad). Años 2007-2009

Cocina

Parece un muelle.

La componente estacional se mueve en un ranfo de \(10^{-11}\), podemos asumir que se ha eliminado esta componente.

Suavizado exponencial de HoltWinters

Pronóstico de HoltWinters para el año 2010

Vamos a predecir las próximas 12 observaciones.

Lavadero

No arece un muelle.

La componente estacional se mueve en un ranfo de \(10^{-11}\), podemos asumir que se ha eliminado esta componente.

Suavizado exponencial de HoltWinters

Pronóstico de HoltWinters para el año 2010

Vamos a predecir las próximas 12 observaciones.

AC y termo eléctrico

No parece un muelle.

La componente estacional se mueve en un ranfo de \(10^{-11}\), podemos asumir que se ha eliminado esta componente.

Suavizado exponencial de HoltWinters

Pronóstico de HoltWinters para el año 2010

Vamos a predecir las próximas 12 observaciones.

Comparación de los coeficientes y resultados de cada predicción

En las gráficas de predicción, hemos observado que el ajuste no mantiene la tendencia de consumo energético de la serie.

Submedidor RMSE
Cocina 20107.15
Lavadero 30744.09
AC y TermoE 183796.72
                     ME    RMSE      MAE          MPE      MAPE      MASE
Training set   1731.629 15017.8 10866.91    0.9448979  21.30004 0.9150282
Test set     -30340.790 36669.6 30805.71 -127.4678788 128.17932 2.5939388
                  ACF1
Training set 0.1996392
Test set            NA

Evolución mensual del consumo (con estacionalidad). Años 2007-2009

Vamos a ver una predicción del consumo enegético de cada submedidor con el método de HW. En este caso, no eliminaremos la estacionalidad, para ver así si se mantiene la tendencia de consumo.

Cocina

Parece un muelle.

La componente estacional se mueve en un ranfo de \(10^{-11}\), podemos asumir que se ha eliminado esta componente.

Suavizado exponencial de HoltWinters

Pronóstico de HoltWinters para el año 2010

Vamos a predecir las próximas 12 observaciones.

Lavadero

No arece un muelle.

TENDENCIA CLARAMENTE DECRECIENTE. Tambien observamos esacionalidad

Suavizado exponencial de HoltWinters

Pronóstico de HoltWinters para el año 2010

Vamos a predecir las próximas 12 observaciones.

AC y termo eléctrico

No parece un muelle.

Suavizado exponencial de HoltWinters

Pronóstico de HoltWinters para el año 2010

Vamos a predecir las próximas 12 observaciones.

Comparación de los coeficientes y resultados de cada predicción
Submedidor RMSE
Cocina 16362.16
Lavadero 27223.90
AC y TermoE 165249.73
                     ME     RMSE       MAE      MPE     MAPE       MASE
Training set   1731.629  15017.8  10866.91  1.43523 22.90328  0.7191145
Test set     236296.355 248450.0 236296.36 75.28922 75.28922 15.6368416
                  ACF1
Training set 0.1996392
Test set            NA

Comparación de resultados. Predicción antes y despues de eliminar la tendencia

En las gráficas de predicción de suaviazado exponencial, hemos observado que el ajuste cuando eliminamos la estacionalidad, no mantiene la tendencia de consumo energético de la serie. Sin embargo, al mantener la estacionalidad se puede apreciar como las predicciones ajustan la tendencia de la serie original

Submedidor RMSE con estacionalidad RMSEDeco sin estacionalidad
Cocina 16362.16 11186.74
Lavadero 27223.90 10939.60
AC y TermoE 165249.73 57300.05

Comparación de resultados. Predicción antes y despues de eliminar estacionalidad

Submedidor RMSE RMSEDeco
Cocina 20107.15 11186.74
Lavadero 30744.09 10939.60
AC y TermoE 183796.72 57300.05

Resultados más fiables y con menor error trás haber descompuesto la serie